Projection operations are a typical computation bottleneck in online learning. In this paper, we enable projection-free online learning within the framework of Online Convex Optimization with Memory (OCO-M) -- OCO-M captures how the history of decisions affects the current outcome by allowing the online learning loss functions to depend on both current and past decisions. Particularly, we introduce the first projection-free meta-base learning algorithm with memory that minimizes dynamic regret, i.e., that minimizes the suboptimality against any sequence of time-varying decisions. We are motivated by artificial intelligence applications where autonomous agents need to adapt to time-varying environments in real-time, accounting for how past decisions affect the present. Examples of such applications are: online control of dynamical systems; statistical arbitrage; and time series prediction. The algorithm builds on the Online Frank-Wolfe (OFW) and Hedge algorithms. We demonstrate how our algorithm can be applied to the online control of linear time-varying systems in the presence of unpredictable process noise. To this end, we develop the first controller with memory and bounded dynamic regret against any optimal time-varying linear feedback control policy. We validate our algorithm in simulated scenarios of online control of linear time-invariant systems.
translated by 谷歌翻译
我们在不可预测的环境中启用有效和有效的协调,即,在未来进化的环境中是未知的先验甚至对抗性的环境。我们受到自治的未来的激励,涉及多个机器人在动态,非结构化和对抗性环境中协调,以完成复杂的任务,例如目标跟踪,图像覆盖率和区域监视。此类任务通常被建模为子管道最大化协调问题。因此,我们介绍了第一个具有有限跟踪遗憾的第一个子管道协调算法,即,关于最佳的时间变化的行动,次要次数有限,这些行动知道未来是先验的未来。该界限随着环境的对抗性能力而优雅地降级。它还量化了机器人必须重新选择的操作以“学习”以进行协调的频率,就像他们知道未来是先验的。我们的算法概括了Fisher等人的开创性顺序贪婪算法。为了不可预测的环境,利用子模性和算法来跟踪最佳专家的问题。我们在目标跟踪的模拟方案中验证算法。
translated by 谷歌翻译
目前,在鸟眼中检测3D对象(BEV)优于其他3D检测器,用于自动驾驶和机器人技术。但是,将图像特征转换为BEV需要特别操作员进行特征采样。这些操作员在许多边缘设备上不受支持,在部署探测器时会带来额外的障碍。为了解决此问题,我们重新审视BEV表示的生成,并在透视图BEV中提出检测对象 - 一种不需要功能采样的新的BEV表示。我们证明,BEV功能同样可以享受BEV范式的好处。此外,视角BEV通过解决特征采样引起的问题来改善检测性能。我们建议基于此发现的透视bev空间中的高性能对象检测提出PERSDET。在实施简单且有效的结构时,SPEDET优于Nuscenes基准上的现有最新单眼方法,在使用Resnet-50作为骨架时,达到34.6%的MAP和40.8%的NDS。
translated by 谷歌翻译
近年来,依靠深度学习技术的受监督和无监督的深层跟踪器很受欢迎。但是,他们要求高计算复杂性和高内存成本。在这项工作中提出了一个绿色的无监督的单对象跟踪器,称为Gusot,旨在针对资源受限环境下的长视频对象跟踪。Gusot建立在基线跟踪器UHP-SOT ++上,它适用于短期跟踪,其中包含两个附加的新模块:1)丢失的对象恢复,以及2)基于颜色的形状建议。它们有助于解决跟踪损失问题,并分别提供更灵活的对象建议。因此,从长远来看,它们使Gusot能够实现更高的跟踪精度。我们在具有长视频序列的大规模数据集Lasot上进行实验,并表明Gusot提供了轻巧的高性能跟踪解决方案,可在移动和边缘计算平台中找到应用程序。
translated by 谷歌翻译
迄今为止,最强大的半监督对象检测器(SS-OD)基于伪盒,该盒子需要一系列带有微调超参数的后处理。在这项工作中,我们建议用稀疏的伪盒子以伪造的伪标签形式取代稀疏的伪盒。与伪盒相比,我们的密集伪标签(DPL)不涉及任何后处理方法,因此保留了更丰富的信息。我们还引入了一种区域选择技术,以突出关键信息,同时抑制密集标签所携带的噪声。我们将利用DPL作为密集老师的拟议的SS-OD算法命名。在可可和VOC上,密集的老师在各种环境下与基于伪盒的方法相比表现出卓越的表现。
translated by 谷歌翻译
与传统的刚性机器人相比,由于合规性,安全性和低成本,软机器人由于其优点而引起了越来越多的关注。作为软机器人的重要组成部分,软机器人夹具还显示出其优越的同时抓住具有不规则形状的物体。已经进行了最近的研究,以通过调整可变有效长度(VEL)来改善其抓握性能。然而,通过多室设计或可调刚度形状记忆材料实现的Vel需要复杂的气动电路设计或耗时的相变过程。这项工作提出了一种由3D印刷灯丝,忍者克朗的折叠式软机器人执行器。它是通过高速模型进行实验测试和表示的。进行数学和有限元建模,以研究所提出的软致动器的弯曲行为。此外,提出了一种拮抗约束机制来实现VEL,并且实验表明实现了更好的符合性。最后,设计了一种双模夹具,以展示Vel对抓取性能的进步。
translated by 谷歌翻译
惯用表达式(IES)在自然语言中起重要作用。在本文中,我们研究了惯用句子解释(ISP)的任务,旨在通过用IE用文字解释来解释一个句子。缺乏与惯用语文平行句子的大型语料库是这项任务的主要挑战,我们考虑了两个单独的解决方案。首先,我们向ISP提出了一个无人监督的方法,它利用IE的上下文信息和定义,不需要并行句子训练集。其次,我们提出了一种弱监督的方法,使用后翻来的方法与IE共同执行释义和生成句子,以扩大小规模并行句子训练数据集。该研究的其他重要衍生物包括一种模型,该模型将句子中的文字短语替换为一种与IE生成惯用表达式和具有惯用/文字句对的大规模并行数据集。拟议的解决方案与竞争性基线相比的有效性在Bleu超过5.16点的相对增益中观察到超过8.75点,在使用自动和手动的并行数据集上经验上验证生成的句子时,Sari超过19.57点评估。我们展示了ISP作为EN-DE机器翻译中的预处理步骤的实用实用性。
translated by 谷歌翻译
周等人提出了一个无人监督,轻质和高性能的单一对象追踪器,称为UHP-SOT。最近。作为一个扩展,我们在这项工作中介绍了一个增强版本并将其命名为UHP-SOT ++。基于基于鉴别相关滤波器的(基于DCF的)跟踪器的基础,在UHP-SOT和UHP-SOT ++中引入了两种新成分:1)背景运动建模和2)对象盒轨迹建模。 UHP-SOT和UHP-SOT ++之间的主要区别是来自三种模型的提案的融合策略(即DCF,背景运动和对象盒轨迹模型)。 UHP-SOT ++采用了一种改进的融合策略,可针对大规模跟踪数据集更加强大的跟踪性能。我们的第二件贡献在于通过在四个SOT基准数据集 - OTB2015,TC128,UAV123和LASOT上进行测试,对最先进的监督和无监督方法进行了广泛的评估。实验表明,UHP-SOT ++优于所有先前的无监督方法和几种深度学习(DL)方法,以跟踪准确性。由于UHP-SOT ++具有极小的模型大小,高跟踪性能和低计算复杂性(即使在I5 CPU上以20 fps运行,即使没有代码优化),则是资源实时对象跟踪中的理想解决方案 - 有限平台。基于实验结果,我们比较监督和无监督者的优缺点,并提供了一种新的视角,了解监督和无监督方法之间的性能差距,这是这项工作的第三次贡献。
translated by 谷歌翻译
知识图表(kgs)以头部关系的形式捕获知识 - 尾部三元组,是许多AI系统中的重要组成部分。 KGS上有两个重要的推理任务:(1)单跳知识图完成,涉及预测公斤中的各个环节; (2),多跳推理,目标是预测哪个kg实体满足给定的逻辑查询。基于嵌入的方法通过首先计算每个实体和关系的嵌入来解决两个任务,然后使用它们形成预测。但是,现有可扩展的KG嵌入框架仅支持单跳知识图完成,并且不能应用于更具挑战性的多跳推理任务。在这里,我们呈现可扩展的多跳推理(SMORE),这是KGS中单跳和多跳推理的第一个总框架。使用单机略微闪烁可以在FreeBase KG(86米实体,338M边缘)中执行多跳推理,比以前考虑的KGs大1,500倍。粉刷运行时性能的关键是一种新的双向抑制采样,实现了在线培训数据生成的复杂性的平方根降低。此外,SMORE利用异步调度,基于CPU的数据采样,基于GPU的嵌入计算和频繁CPU - GPU IO。 Smore通过2.2倍提高了82倍的吞吐量(即,训练速度),以最小的GPU存储器要求(2GB用于训练86M节点FreeBase上的400微米嵌入),并达到与GPU的数量接近线性加速。此外,在更简单的单跳知识图形完成任务中,Smore实现了对单个GPU和多GPU设置的最先进框架的可比或更好的运行时间性能。
translated by 谷歌翻译
在本文中,我们提出了一种添加在生成的对抗网络(GaN)中不可替代的约束的方法(GaN)的任意大小原始拜耳图像生成。理论上,通过使用GaN培训中的转换数据来说,它能够改善原始数据分布的学习,由于在可逆性和可微分的变换下的两个分布之间的Jensen-Shannon(JS)发散。受益于所提出的方法,可以通过将变换配置为Demosaicing来生成原始拜耳图案图像。结果表明,通过添加另一个变换,所提出的方法能够合成具有任意尺寸的高质量未加工拜耳图像。实验结果表明,所提出的方法生成的图像优于FR \'Echet Inception距离(FID)得分中的现有方法,峰值信号到噪声比(PSNR),以及平均结构相似度(MSSIM),训练过程更多稳定的。为了提出作者的最佳知识,未加工拜耳域中没有开源,大型图像数据集,这对于研究工程至关重要,旨在探索计算机视觉任务的图像信号处理(ISP)管道设计。将现有的常用彩色图像数据集转换为相应的博客版本,所提出的方法可以是对原始图像数据集问题的有希望的解决方案。我们还在实验中显示,通过使用合成的原始拜耳图像训练对象检测框架,可以以端到端的方式(从原始图像到视觉任务)使用,具有可忽略的性能下降。
translated by 谷歌翻译